福利 | Spark快速大数据分析

2019-03-22Spark点击

谨以此书献给所有大数据相关从业者。

一、Spark概述

Apache Spark是一种快速通用的集群计算系统。它提供使用Python、Java、Scala、SQL（应对交互式查询）的标准API来快速操控大规模数据集。它还支持一组丰富的高级工具，包括用于SQL和结构化数据处理的Spark SQL，用于实时数据进行流式计算Spark Streaming，用于机器学习的MLlib和用于图形处理的GraphX等。满足各种不同应用场景下的需求，俨然发展成了一种生态。

Spark的一个主要特点就是能够在内存中进行计算，因而更快。不过即使是必须在磁盘上进行的复杂计算，Spark 依然比MapReduce更加高效。

伴随着人工智能与机器学习的快速发展，TensorFlow on Spark、Caffe on Spark也让Spark变得更加火爆。

二、推荐一本书

《Spark快速大数据分析》是一本为Spark初学者准备的书，它没有过多深入实现细节，而是更多关注上层用户的具体用法。不过，本书绝不仅仅限于Spark的用法，它对Spark的核心概念和基本原理也有较为全面的介绍，让读者能够知其然且知其所以然。

该书由Spark开发者及核心成员共同打造，讲解了网络大数据时代应运而生的、能高效迅捷地分析处理数据的工具——Spark，它带领读者快速掌握用Spark收集、计算、简化和保存海量数据的方法，学会交互、迭代和增量式分析，解决分区、数据本地化和自定义序列化等问题。

三、PDF电子版

高清PDF获取方式：

长按识别以下二维码，关注“大数据实战演练”官方公众号，回复“1123”，即可免费获取高清PDF电子版。

心动不如行动，永远都要有学东西不怕迟的勇气与决心，现在就行动起来吧！

再见

点关注，不迷路

好了各位，以上就是这篇文章的全部内容了，能看到这里的人呀，都是人才。

白嫖不好，创作不易。各位的支持和认可，就是我创作的最大动力，我们下篇文章见！

如果本篇博客有任何错误，请批评指教，不胜感激！

微信公众号二维码

↑
坚持原创技术分享，您的支持将鼓励我继续创作！

原文作者: create17
原文链接: https://841809077.github.io/2019/03/22/MySelf/福利/福利 Spark快速大数据分析.html
版权声明: 转载请注明出处(码字不易，请保留作者署名及链接，谢谢配合！)